Jednym z większych wyzwań stojących przed statystyką publiczną w XXI w. jest wykorzystanie alternatywnych źródeł danych o cenach w celu unowocześnienia statystyki cen konsumpcyjnych, a w rezultacie – zwiększenia dokładności i rzetelności danych o inflacji. Trudności w zbieraniu danych metodą tradycyjną spowodowane przez COVID-19 (obostrzenia dotyczące utrzymywania dystansu, które ograniczyły wyjścia ankieterów w teren, i zamykanie punktów sprzedaży) wpłynęły na zintensyfikowanie prac nad alternatywnymi źródłami danych. W artykule przedstawiono wyniki badania eksperymentalnego, w którym wykorzystano dane o cenach uzyskane metodą tradycyjną (przez ankieterów) oraz dane skanowane i skrapowane, pochodzące z sieci handlowej działającej w Polsce. Głównym celem badania było określenie występowania i oszacowanie wielkości różnic w poziomie cen i wartościach wskaźnika cen wybranych produktów spożywczych obliczonych metodą tradycyjną oraz z wykorzystaniem alternatywnych źródeł danych, czyli danych skanowanych i skrapowanych. Za dodatkowy cel postawiono sobie zidentyfikowanie przyczyn tych różnic w odniesieniu do specyfiki źródeł danych.
Badaniem empirycznym objęto luty i marzec 2021 r. Wyniki otrzymane na podstawie danych z różnych źródeł porównano za pomocą metod graficznych (histogramy, wykresy pudełkowe) oraz wyznaczenia elementarnych indeksów według formuł Dutota, Carliego i Jevonsa. Wyniki wskazały na rozbieżności – niekiedy znaczne – w rozkładach cen uzyskanych z różnych źródeł danych, co skłania do wniosku, że zastosowanie danych skanowanych i skrapowanych może prowadzić do zawyżania lub zaniżania wskaźników cen uzyskanych metodą tradycyjną.
W artykule omówiono również podstawowe aspekty metodologiczne dotyczące uzyskiwania i wykorzystywania danych ze źródeł alternatywnych oraz wskazano prawdopodobne przyczyny różnic, jakie zaobserwowano zarówno w rozkładach cen produktów, jak i w wartościach miesięcznego wskaźnika cen obliczonego przy wykorzystaniu danych z różnych źródeł.
wskaźniki cen, dane skanowane, dane skrapowane, inflacja
C43, E31
Bertoloto, M., Cavallo, A., Rigobon, R. (2014). Using Online Prices to Anticipate Official CPI Inflation (UTokyo Price Project Working Paper No. 049). https://www.centralbank.e.u-tokyo.ac.jp/wp-content/uploads/2018/08/p_wp049.pdf .
Białek, J. (2020a). Wykorzystanie danych skanowanych do pomiaru inflacji – doświadczenia międzynarodowe i wyzwania metodologiczne. Wiadomości Statystyczne. The Polish Statistician, 65(1), 9–33. https://doi.org/10.5604/01.3001.0013.902 .
Białek, J. (2020b). Comparison of elementary price indices. Communications in Statistics – Theory and Methods, 49(19), 4787–4803. https://doi.org/10.1080/03610926.2019.1609035 .
Białek, J. (2021). PriceIndices – a New R Package for Bilateral and Multilateral Price Index Calculations. Statistika: Statistics and Economy Journal, 101(2), 122–141.
Białek, J., Bobel, A. (2019, 8–10 maja). Comparison of Price Index Methods for CPI Measurement using Scanner Data [referat]. 16th Meeting of the Ottawa Group on Price Indices, Rio de Janeiro.
Carli, G. (1804). Del valore e della proporzione de’metalli monetati. W: Scrittori Classici Italiani di Economia Politica: 13 (s. 297–336). Milano: G. G. Destefanis.
Chessa, A. (2015, 20–22 maja). Towards a generic price index method for scanner data in the Dutch CPI [referat]. 14th meeting of the Ottawa Group on Price Indices, Tokyo.
Chessa, A. G. (2016). A new methodology for processing scanner data in the Dutch CPI. Eurostat Review of National Accounts and Macroeconomic Indicators, (1), 49–69. https://ec.europa.eu/eurostat/cros/system/files/euronaissue1-2016-art2.pdf .
Diewert, W. E., Fox, K. J. (2018). Substitution bias in multilateral methods for CPI construction using scanner data (UNSW Economics Working Paper No. 2018-13). http://research.economics.unsw.edu.au/RePEc/papers/2018-13.pdf .
Domingos, P., Pazzani, M. (1997). On the Optimality of the Simple Bayesian Classifier under Zero- One Loss. Machine Learning, 29(2–3), 103–130. https://doi.org/10.1023/A:1007413511361 .
Dutot, C. F. (1738). Reflexions Politiques sur les Finances et le Commerce. The Hague: Les freres Vaillant et Nicolas Prevost.
Eurostat. (2018). Harmonised Index of Consumer Prices (HICP): Methodological Manual. Luxembourg: Publications Office of the European Union. https://ec.europa.eu/eurostat/documents/3859598/9479325/KS-GQ-17-015-EN-N.pdf/d5e63427-c588-479f-9b19-f4b4d698f2a2 .
de Haan, J. (2006). The re-design of the Dutch CPI. Statistical Journal of the United Nations Economic Commission for Europe, 23(2–3), 101–118. https://doi.org/10.3233/SJU-2006-232-302 .
International Monetary Fund, International Labour Organization, Statistical Office of the European Union (Eurostat), Organisation for Economic Co-operation and Development, The World Bank. (2020). Consumer Price Index Manual: Concepts and Methods. Geneva. https://www.ilo.org/global/statistics-and-databases/publications/WCMS_761444/lang--en/index.htm .
Jaro, M. A. (1989). Advances in Record-Linkage Methodology as Applied to Matching the 1985 Census of Tampa, Florida. Journal of the American Statistical Association, 84(406), 414–420. https://doi.org/10.1080/01621459.1989.10478785 .
Jevons, W. S. (1865). On the Variation of Prices and the Value of the Currency since 1782. Journal of Statistical Society of London, 28(2), 294–320. https://doi.org/10.2307/2338419.
Kalisch, D. W. (2016). Making Greater Use of Transactions Data to Compile the Consumer Price Index, Australia (ABS Information Paper No. 6401.0.60.003). https://www.ausstats.abs.gov.au/ausstats/subscriber.nsf/0/FE1AE4B7443728E5CA258079000EAF99/$File/6401060003_2016.pdf .
Laspeyres, E. (1871). IX. Die Berechnung einer mittleren Warenpreissteigerung. Jahrbücher für Nationalökonomie und Statistik, 16(1), 296–318. https://doi.org/10.1515/jbnst-1871-0124 .
Loon, K. V., Roels, D. (2018, 7–9 maja). Integrating big data in the Belgian CPI [referat]. Meeting of the Group of Experts on Consumer Price Indices, Geneva.
Winkler, W. E. (1990). String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage. W: Proceedings of the Section on Survey Research Methods (s. 354–359). Alexandria: American Statistical Association. http://www.asasrms.org/Proceedings/y1990f.html